Convolutional এবং Pooling Layers

Machine Learning - পাইটর্চ (Pytorch) - Convolutional Neural Networks (CNN)

261

Convolutional Layers এবং Pooling Layers ডিপ লার্নিংয়ের বিশেষ ধরনের লেয়ার, যা প্রধানত Convolutional Neural Networks (CNNs)-এ ব্যবহৃত হয়। এগুলি বিশেষভাবে চিত্র প্রক্রিয়াকরণ এবং কম্পিউটার ভিশন সমস্যা সমাধানে ব্যবহৃত হয়। নিচে এই লেয়ারগুলির কাজ, গুরুত্ব এবং উদাহরণ আলোচনা করা হলো।

১. Convolutional Layer

Convolutional Layer হল একটি নিউরাল নেটওয়ার্ক লেয়ার যা ইনপুট (যেমন, চিত্র) থেকে বৈশিষ্ট্য (features) বের করার জন্য কনভোলিউশন অপারেশন ব্যবহার করে। এটি এক ধরনের ফিল্টার (filter) বা কন্নেকশন ওয়েটস (connection weights) ব্যবহার করে ইনপুট ডেটাকে স্ক্যান করে এবং আউটপুট হিসেবে ফিচার ম্যাপ (feature map) বা অ্যাক্টিভেশন ম্যাপ (activation map) তৈরি করে।

কনভোলিউশন অপারেশন কী?

কনভোলিউশন অপারেশনটি মূলত একটি ফিল্টার বা কনভোলিউশন কনভেক্ট (convolution kernel) ব্যবহার করে ইনপুট ডেটার উপর গাণিতিক অপারেশন সম্পন্ন করে। এই ফিল্টারটি ছোট ছোট অংশে ইনপুট ডেটাকে স্ক্যান করে এবং সংশ্লিষ্ট সেগমেন্টের জন্য একটি নতুন ভ্যালু তৈরি করে।

ইনপুট: সাধারণত একটি চিত্র বা মাল্টি-ডাইমেনশনাল টেনসর (যেমন, 3 চ্যানেল RGB চিত্র)।
ফিল্টার (Kernel): একটি ছোট আকারের ম্যাট্রিক্স (যেমন, 3x3 বা 5x5) যা ইনপুট ডেটার উপর স্লাইড করে।

কনভোলিউশন লেয়ারের কাজ:

ফিল্টার স্ক্যান: ইনপুট ডেটার ওপর ফিল্টার বা কনভোলিউশন কনভেক্ট স্ক্যান করে।
ওজন যোগফল: ইনপুট ডেটার প্রতিটি সেগমেন্টে ফিল্টারের উপাদানগুলোর সাথে গুণফল করে এবং একটি আউটপুট তৈরি হয়।
ফিচার ম্যাপ তৈরি: প্রতিটি ফিল্টার আউটপুটের সাথে একটি নতুন ফিচার ম্যাপ তৈরি করা হয়।

উদাহরণ:

import torch
import torch.nn as nn

# একটি কনভোলিউশনাল লেয়ার উদাহরণ
conv_layer = nn.Conv2d(in_channels=3, out_channels=16, kernel_size=3, stride=1, padding=1)

# একটি উদাহরণ ইনপুট (3 চ্যানেল, 32x32 ইমেজ)
input_image = torch.randn(1, 3, 32, 32)

# কনভোলিউশনাল লেয়ার ব্যবহার
output = conv_layer(input_image)
print(output.shape)

এখানে:

in_channels=3: ইনপুট চ্যানেল সংখ্যা (যেমন RGB চিত্রে ৩টি চ্যানেল),
out_channels=16: আউটপুট চ্যানেল সংখ্যা (ফিল্টারের সংখ্যা),
kernel_size=3: ফিল্টারের আকার (3x3),
stride=1: ফিল্টারের স্ক্যান করার গতি,
padding=1: ইনপুট ডেটার সীমানার কাছাকাছি ফিল্টার প্রয়োগের জন্য প্যাডিং যোগ করা।

২. Pooling Layer

Pooling Layer হল একটি ডাউনস্যাম্পলিং লেয়ার যা ইনপুট চিত্রের আকার ছোট করে, তবে মুল বৈশিষ্ট্যগুলি বজায় রাখে। এই লেয়ারটি max pooling বা average pooling ব্যবহার করে ইনপুট ডেটাকে সামান্য সংকুচিত করে এবং একটি সারাংশ তৈরি করে, যা মডেলকে কম্পিউটেশনাল দক্ষতা বাড়াতে সাহায্য করে।

Pooling অপারেশন কী?

Pooling অপারেশন মূলত একটি নির্দিষ্ট আকারের উইন্ডো ব্যবহার করে ইনপুট ডেটা স্ক্যান করে এবং প্রতি উইন্ডোর জন্য একটি মান বের করে। দুইটি প্রধান ধরনের পুলিং:

Max Pooling: প্রতিটি পুলিং উইন্ডোর মধ্যে সর্বোচ্চ মান (maximum value) গ্রহণ করা হয়।
Average Pooling: প্রতিটি পুলিং উইন্ডোর মধ্যে গড় মান (average value) গ্রহণ করা হয়।

Pooling Layer এর কাজ:

পুলিং উইন্ডো: একটি ছোট উইন্ডো (যেমন 2x2 বা 3x3) ইনপুট ডেটাতে স্লাইড করে।
ফিচার রিডিউস: উইন্ডোটি চলার সময়, নির্দিষ্ট অপারেশন (Max বা Average) প্রয়োগ করা হয় এবং নতুন আউটপুট তৈরি হয়।
ডাউনস্যাম্পলিং: আউটপুটের আকার ইনপুটের তুলনায় ছোট হয়, তবে মুল বৈশিষ্ট্যগুলি বজায় থাকে।

উদাহরণ:

import torch
import torch.nn as nn

# একটি পুলিং লেয়ার উদাহরণ (Max Pooling)
pool_layer = nn.MaxPool2d(kernel_size=2, stride=2)

# একটি উদাহরণ ইনপুট (1 চ্যানেল, 4x4 চিত্র)
input_image = torch.randn(1, 1, 4, 4)

# পুলিং লেয়ার ব্যবহার
output = pool_layer(input_image)
print(output.shape)

এখানে:

kernel_size=2: পুলিং উইন্ডোর আকার (2x2),
stride=2: পুলিং উইন্ডোর গতি।

৩. Convolutional এবং Pooling Layers এর ভূমিকা

Convolutional Layer: ইনপুট চিত্র থেকে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি বের করার জন্য ব্যবহৃত হয়, যেমন প্রান্ত (edges), টেক্সচার (textures), এবং অন্যান্য আকৃতি। এটি বিভিন্ন ফিচার ম্যাপ তৈরি করতে সহায়ক।
Pooling Layer: ইনপুট চিত্রের আকার কমিয়ে ফিচার সিলেকশন এবং ডাউনস্যাম্পলিংয়ের মাধ্যমে গাণিতিক হিসাব কমিয়ে আনে। এতে মডেল দ্রুত এবং দক্ষভাবে কাজ করতে পারে।

সারাংশ

Convolutional Layers চিত্র বা ডেটার গুরুত্বপূর্ণ বৈশিষ্ট্য বের করতে সহায়ক, এবং Pooling Layers আউটপুট ডেটার আকার ছোট করে এবং মূল বৈশিষ্ট্যগুলি রক্ষা করে। এগুলি মিলে একত্রে কাজ করে Convolutional Neural Networks (CNNs) তৈরি করতে, যা চিত্র সনাক্তকরণ, অবজেক্ট ডিটেকশন, ভাষা প্রক্রিয়াকরণ, এবং আরও অনেক ক্ষেত্রে ব্যবহৃত হয়।

Content added By

SATT Academy

CNN এর ভূমিকা এবং গঠন PyTorch দিয়ে CNN তৈরি Image Classification প্রজেক্ট উদাহরণ

Convolutional এবং Pooling Layers

১. Convolutional Layer

কনভোলিউশন অপারেশন কী?

কনভোলিউশন লেয়ারের কাজ:

উদাহরণ:

২. Pooling Layer

Pooling অপারেশন কী?

Pooling Layer এর কাজ:

উদাহরণ:

৩. Convolutional এবং Pooling Layers এর ভূমিকা

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

Convolutional এবং Pooling Layers

১. Convolutional Layer

কনভোলিউশন অপারেশন কী?

কনভোলিউশন লেয়ারের কাজ:

উদাহরণ:

২. Pooling Layer

Pooling অপারেশন কী?

Pooling Layer এর কাজ:

উদাহরণ:

৩. Convolutional এবং Pooling Layers এর ভূমিকা

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!